Regroupement bayesien variationnel des locuteurs
نویسندگان
چکیده
In this paper we explore the use of Variational Bayesian (VB) learning in unsupervised speaker clustering. VB learning is a relatively new learning technique that has the capacity of doing at the same time parameter learning and model selection. We run experiments on the NIST 1996 HUB-4 evaluation test for speaker clustering. Two cases are considered : the speaker number is a priori known and it has to be estimated. We evaluate results in terms of average cluster purity and average speaker purity. VB shows a higher accuracy compared to the Maximum Likelihood solution.
منابع مشابه
Nouvelle approche pour le regroupement des locuteurs dans des émissions radiophoniques et télévisuelles (New approach for speaker clustering of broadcast news) [in French]
RÉSUMÉ Dans cet article, nous proposons un nouveau modèle de regroupement de locuteurs pour la tâche de segmentation et de regroupement de locuteurs. Un des problèmes majeur rencontré dans le regroupement des locuteurs est que les algorithmes d’agglomération hiérarchique utilisés ne garantissent pas de donner une solution optimale. Nous proposons d’exprimer le problème de regroupement des locut...
متن کاملDétection de locuteurs dans les séries TV
RÉSUMÉ. La segmentation de flux audio en locuteurs apparaît particulièrement délicate lorsqu’elle est appliquée à des films de fiction, où de nombreux personnages parlent dans des conditions acoustiques variables (musique de fond, bruitages, fluctuations dans l’intonation...). Au-delà d’une telle variabilité acoustique, ce type de films exhibe cependant de la régularité sur le plan visuel, part...
متن کاملAutomatic transcription of Broadcast News
This paper describes the IBM approach to Broadcast News Transcription. Typical problems in the Broadcast News Transcription task are segmentation, clustering, acoustic modeling, language modeling and acoustic model adaptation. This paper presents new algorithms for each of these focus problems. Some key ideas include Bayesian Information Criterion (for segmentation, clustering and acoustic mode...
متن کاملSegmentation en locuteurs d'un document audio
R esum e: Dans cet article, nous abordons le probl eme de la segmentation en locuteurs. Le but est d'obtenir des segments de locuteurs homog enes, c'esta-dire ne contenant les paroles que d'un seul et même locuteur. Ces segments doivent être les plus longs possible. Dans notre etude, nous faisons les hypoth eses qu'aucune connaissance a priori sur les locuteurs n'est disponible et que les perso...
متن کاملIdentification des locuteurs par regroupement hiérarchique ascendant et modèles d’ancrage
The process of speaker recognition is generally based on modeling the characteristics of each speaker. An interesting method for modeling consists in representing a new speaker, not in an absolute manner, but relatively to a set of well trained speakers. Each speaker is represented by its location in an optimal space of eigen or virtual voices. We hope that the relative position of a speaker in...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2004